21世紀(jì)經(jīng)濟(jì)報道記者 孫燕 鄧浩
存儲漲價潮,正從DRAM蔓延向NAND。
繼1月三星電子將NAND閃存合約價格上調(diào)100%以上后,2月以來,多家市場研究機(jī)構(gòu)紛紛上修了對NAND閃存價格的預(yù)測。
2月2日,TrendForce集邦咨詢上修了第一季DRAM、NAND Flash各產(chǎn)品價格季成長幅度,NAND Flash合約價從季增33-38%上調(diào)至55-60%,并且不排除仍有進(jìn)一步上修空間。
Counterpoint也在2月3日表示,根據(jù)該機(jī)構(gòu)的2026年1月存儲價格追蹤報告,NAND閃存價格預(yù)計(jì)將在本季度上漲超過40%。
“閃存漲價主要還是AI需求量太大了?!盜O資本創(chuàng)始合伙人趙占祥對21世紀(jì)經(jīng)濟(jì)報道記者表示,AI推理以及最新一代AI大模型傾向于在推理過程中做一些訓(xùn)練,雙雙帶動了閃存的需求。
隨著生成式AI從訓(xùn)練階段全面邁入大規(guī)模推理應(yīng)用,NAND閃存需求一路走高。
AI對NAND的需求,主要來自RAG(檢索增強(qiáng)生成):為了解決大語言模型普遍存在的“幻覺”痛點(diǎn),能夠通過檢索外部知識庫來增強(qiáng)生成準(zhǔn)確性的企業(yè)級RAG應(yīng)用正加速滲透落地。
然而,這要求企業(yè)將TB乃至PB級的私有知識庫進(jìn)行向量化并持久化存儲。在推理階段,系統(tǒng)必須在極高的并發(fā)下,對這些海量向量庫進(jìn)行毫秒級的實(shí)時檢索與精準(zhǔn)召回。這種高頻、隨機(jī)且對延遲極度敏感的讀操作,暴露了傳統(tǒng)存儲的性能短板,迫使企業(yè)大規(guī)模采用高性能企業(yè)級SSD。這一趨勢直接引爆了市場對高品質(zhì)、高帶寬NAND原廠顆粒的強(qiáng)勁需求。
與此同時,Long Context(長上下文)也加劇了這一趨勢。與訓(xùn)練階段不同,推理過程需要高頻訪問保存上下文狀態(tài)的數(shù)據(jù)(即KV Cache)。當(dāng)大模型的上下文窗口突破100萬甚至1000萬token時,這些海量的中間狀態(tài)數(shù)據(jù)已無法被GPU內(nèi)部的HBM或DRAM單獨(dú)容納,必須溢出到外部存儲。
為了將KV Cache從昂貴的HBM中解放出來,構(gòu)建多級分層緩存體系已成為業(yè)界共識。目前的普遍方案是將KV Cache卸載到DRAM及高速SSD(固態(tài)硬盤)中。如DeepSeek的Engram架構(gòu)利用DRAM和SSD來分流HBM的壓力,大幅降低了長上下文推理的成本;英偉達(dá)在即將推出的Rubin平臺上,也計(jì)劃通過BlueField-4智能網(wǎng)卡構(gòu)建推理上下文存儲方案。
這帶來了NAND閃存增量需求:當(dāng)前,全球NAND年度總需求約800EB。而鎧俠在業(yè)績說明會上披露,經(jīng)與英偉達(dá)溝通測算,英偉達(dá)KV Cache相關(guān)應(yīng)用在2027年或?qū)㈩~外帶來約75-100EB的NAND需求,且該需求在2028年有望進(jìn)一步翻倍。
招商證券指出,AI推理驅(qū)動存儲架構(gòu)向“HBM+DRAM+NAND”三級金字塔架構(gòu)演進(jìn),RAG與長上下文確立了大容量NAND在降本增效與解決“模型幻覺”中的核心地位。
“現(xiàn)在AI的需求主要來自兩方面。一方面是AI推理,會有大量上下文的KV Cache,這些數(shù)據(jù)需要存儲到SSD里面。因此,閃存的需求量在推理方面是增加的?!壁w占祥告訴記者,另一方面,最新一代AI大模型傾向于在推理過程中也要做一些訓(xùn)練,就像人腦一樣,邊學(xué)習(xí)邊推理,而學(xué)習(xí)對存儲的需求就更大了,本質(zhì)上就是“以存力來換算力”。
在“以大容量廉價存儲換取算力效率”的技術(shù)路徑下,數(shù)據(jù)中心對NAND需求增速超過DRAM。據(jù)TechInsights預(yù)測,2023-2030年,數(shù)據(jù)中心NAND位元需求CAGR達(dá)32.6%,而數(shù)據(jù)中心DRAM位元需求CAGR為28.3%。
但從供給端看,全球NAND Flash存儲晶圓產(chǎn)能集中在三星電子、SK海力士、美光、西部數(shù)據(jù)/閃迪、鎧俠、長江存儲、長鑫存儲等少數(shù)巨頭手中。而頭部原廠正將資本開支優(yōu)先向HBM及先進(jìn)DRAM產(chǎn)能傾斜,NAND領(lǐng)域的投資增速相對落后。
供需錯位之下,摩根大通預(yù)測,2026年NAND行業(yè)平均銷售價格將同比上漲40%,2027年也僅微跌2%,依然維持高位。
盡管傳統(tǒng)NAND SSD提供了巨大的存儲容量,但其帶寬瓶頸和毫秒級延遲使其無法跟上GPU的算力節(jié)奏,導(dǎo)致AI芯片在等待數(shù)據(jù)時陷入“空轉(zhuǎn)”。
面對“內(nèi)存墻”問題,閃迪推出了新型的AI存儲架構(gòu)高帶寬閃存(High Bandwidth Flash,HBF)。該架構(gòu)將3D NAND閃存與類似HBM的高帶寬接口技術(shù)深度融合,提供比傳統(tǒng)HBM高出8到16倍的容量。盡管其延遲高于DRAM,但通過大幅提升接口帶寬,其讀取性能已有望逼近HBM水平。
緊隨其后,據(jù)媒體報道,SK海力士正與閃迪合作,致力于HBF標(biāo)準(zhǔn)的制定。據(jù)現(xiàn)有規(guī)劃,閃迪計(jì)劃在2026年下半年交付其HBF內(nèi)存的首批樣品,并預(yù)計(jì)首批搭載HBF的AI推理設(shè)備樣品將于2027年初上市。
巨頭紛紛押注背后,HBF的核心優(yōu)勢在于其結(jié)合了高帶寬與大容量,且成本更具競爭力,這些特性使其特別適合讀取密集型的AI推理等大容量應(yīng)用場景。
有NAND設(shè)計(jì)企業(yè)負(fù)責(zé)人告訴記者,目前在AI計(jì)算系統(tǒng)中,計(jì)算存儲主要用DRAM、HBM等。但隨著產(chǎn)品和硬件架構(gòu)的不斷推進(jìn),DRAM的高功耗、高成本問題不斷凸顯。如果用HBF代替DRAM,整個系統(tǒng)的性能和成本都會得到提升。
具體而言,目前計(jì)算機(jī)架構(gòu)主要依賴DRAM配合CPU/NPU進(jìn)行計(jì)算,但傳統(tǒng)DRAM面臨成本瓶頸:若DRAM容量僅16GB,系統(tǒng)僅能支撐8GB小模型,存儲器成本約40美元;若要支撐更聰明的32GB大模型,需大幅提升DRAM規(guī)格,導(dǎo)致成本飆升至100美元。
為此,有企業(yè)提出引入HBF來替代大部分DRAM的容量需求,并利用其高帶寬特性承擔(dān)AI計(jì)算所需的讀取功能。該架構(gòu)在將DRAM容量減半、保持存儲成本僅40美元的同時,成功支撐32GB大模型,實(shí)現(xiàn)了更高的系統(tǒng)性能和更低的能耗。
國金證券研究指出,隨著3DNAND層數(shù)突破200層、HBM4量產(chǎn)體系逐步建立、三星HBF等新架構(gòu)研發(fā)推進(jìn),存儲產(chǎn)業(yè)正朝著“DRAM緩存+HBF加速+NAND海量存儲”的多層架構(gòu)演進(jìn),技術(shù)突破將逐步緩解供需矛盾,推動行業(yè)進(jìn)入新的增長軌道。